目录
  1. 1. 一、DeepSeek 相关岗位画像(通用要求)
  2. 2. 二、现有文档全索引(按学习优先级)
    1. 2.1. 🔴 第一优先级:Agent 框架核心(必须掌握)
    2. 2.2. 🟠 第二优先级:工程支撑层
    3. 2.3. 🟠+ 第二优先级补充:深度专题(新增文档)
    4. 2.4. 🟡 第三优先级:进阶与扩展
    5. 2.5. 🟢 第四优先级:系统设计与面试准备
    6. 2.6. 🔵 LLM 技术深度(理论储备)
  3. 3. 三、必须掌握的技能栈
    1. 3.1. 3.1 核心工程技能
    2. 3.2. 3.2 Agent 框架设计能力
    3. 3.3. 3.3 安全与权限模型
    4. 3.4. 3.4 LLM 接入与流式处理
    5. 3.5. 3.5 系统设计能力
    6. 3.6. 3.6 LLM 理论基础(对 DeepSeek 尤其重要)
  4. 4. 四、Harness 架构的核心概念速查
  5. 5. 五、关键源码文件速查
  6. 6. 六、推荐学习顺序(3-4周计划)
    1. 6.1. 第 1 周:Agent 框架核心
    2. 6.2. 第 2 周:工程支撑与协议
    3. 6.3. 第 3 周:LLM 理论(DeepSeek 特色)
    4. 6.4. 第 4 周:系统设计与面试准备
  7. 7. 七、面试高频问题预测(CC Harness 视角)
  8. 8. 八、覆盖度评估(2026-05-27 最终版)
    1. 8.1. 已完成文档(28篇)
    2. 8.2. 覆盖度:✅ 100%(所有主要子系统均有深度文档)
【Claude Code源码剖析】番外-DeepSeek 招聘 × Claude Code Harness 框架 — 技能栈全攻略

目标:以 Claude Code (CC) 2.1.88 源码为蓝本,针对 DeepSeek Agent Infra / LLM Application 方向岗位,整理所有必须掌握的知识点、现有文档索引和学习优先级。


一、DeepSeek 相关岗位画像(通用要求)

DeepSeek 在 Agent/应用侧的岗位通常要求以下几类能力:

能力维度 典型要求
LLM 基础 理解 Transformer 架构、RLHF、Reasoning 模型训练原理
Agent 框架 会设计 Agentic Loop、Tool Use、多 Agent 协作
工程能力 TypeScript/Python 大型项目、异步并发、流式处理
系统设计 高并发连接管理、状态持久化、可中断恢复
协议 MCP(Model Context Protocol)、Streaming SSE/WebSocket
安全 权限模型、沙箱隔离、注入防御

二、现有文档全索引(按学习优先级)

🔴 第一优先级:Agent 框架核心(必须掌握)

文档 路径 核心内容
总览与学习路线 docs/00-总览与学习路线.md CC 整体架构图、技术栈、模块地图
启动引导与初始化 docs/01-启动引导与初始化流程.md main.tsxinit()launchRepl() 启动链
Agentic 查询循环 docs/02-Agentic查询循环与QueryEngine.md ⭐ Agentic Loop 核心,query() / QueryEngine
工具系统 docs/03-工具系统Tool-System.md ⭐ Tool 注册/调度/并行执行机制
权限与安全系统 docs/05-权限与安全系统.md ⭐ 权限决策树、沙箱模型、Harness 边界
完整请求处理流水线 docs/17-完整请求处理流水线.md ⭐ 端到端全链路,面试核心材料
智能化核心机制 docs/16-智能化核心机制深度解析.md ⭐ 上下文压缩、中断恢复、多 Agent

🟠 第二优先级:工程支撑层

文档 路径 核心内容
API 通信与 Streaming docs/08-API通信与Streaming.md SSE 流式处理、backpressure、token 计量
状态管理系统 docs/07-状态管理系统.md 轻量 Store、AppStateStore、发布订阅
上下文窗口管理 docs/10-上下文窗口管理与压缩.md 压缩策略、SNIP、Token Budget
任务与多 Agent docs/11-任务与多Agent系统.md Task 编排、SubAgent、协调协议
MCP 协议集成 docs/09-MCP协议集成.md MCP Client/Server、工具扩展协议
命令系统 docs/04-命令系统Command-System.md 60+ 斜杠命令注册/路由

🟠+ 第二优先级补充:深度专题(新增文档)

文档 路径 核心内容
Swarm 多 Agent 协调 docs/20-Swarm多Agent协调系统.md TeamFile/Mailbox 协议、权限同步、inProcessRunner
SystemPrompt 构建 docs/21-SystemPrompt构建与Prompt工程.md Section 缓存机制、动态边界、编码约束
Session 管理与恢复 docs/22-Session管理与状态恢复.md JSONL Transcript、墓碑机制、Worktree Session
MemDir 记忆系统 docs/23-MemDir自动记忆系统.md 四类记忆、MEMORY.md、AI 语义检索(findRelevantMemories)
Computer Use docs/24-ComputerUse桌面自动化系统.md Chicago 系统、MCP 集成、截图流水线、坐标系
LSP 集成 docs/25-LSP集成与IDE能力.md 诊断注册表、文件同步、多服务器路由
Plan Mode V2 docs/26-PlanModeV2规划模式.md 5 阶段工作流、探索 Agent、Pewter Ledger 实验
VCR 测试基础设施 docs/27-VCR测试基础设施.md 录制/回放、dehydrate、CI fixture 强制检查

🟡 第三优先级:进阶与扩展

文档 路径 核心内容
终端 UI(React Ink) docs/06-终端UI与React-Ink.md React → 终端渲染,可选了解
远程桥接 Bridge docs/12-远程桥接Bridge系统.md CCR 远程容器、WebSocket 控制平面
插件与技能系统 docs/13-插件与技能系统.md 技能注册、bundled skill、hook
成本追踪与 Token 管理 docs/14-成本追踪与Token管理.md 计费、Token 追踪
核心工具函数库 docs/15-核心工具函数库.md 通用 utils

🟢 第四优先级:系统设计与面试准备

文档 路径 核心内容
系统设计第一性原理 docs/OpenClaw系列/12-SYSTEM_DESIGN_PRINCIPLES.md 从根本问题出发的架构推导
面试速查表(原版) docs/OpenClaw系列/13-INTERVIEW_CHEATSHEET.md ⭐ 面试标准答案、追问应对
面试题全集(新版) docs/28-面试题全集与岗位需求.md ⭐⭐ 200+ 题,覆盖全部28个模块,含代码题
第一性原理总结 docs/OpenClaw系列/11-FIRST_PRINCIPLES_SUMMARY.md 全套材料导读
OpenClaw 真实项目分析 docs/OpenClaw系列/OpenClaw真实项目分析.md 实战案例分析

🔵 LLM 技术深度(理论储备)

文档 路径 核心内容
Transformer 架构深度解析 docs/LLM技术深度系列/01-Transformer架构完全深度解析.md Attention 数学、KV Cache
大模型预训练 docs/LLM技术深度系列/02-大模型预训练技术全景.md 预训练数据、架构演进
RLHF 完整解析 docs/LLM技术深度系列/03-RLHF完整技术解析.md PPO、奖励模型
Reasoning 模型训练 docs/LLM技术深度系列/05-Reasoning模型训练技术全景.md ⭐ DeepSeek-R1 相关核心
MoE 稀疏架构 docs/LLM技术深度系列/06-MoE稀疏架构深度解析.md ⭐ DeepSeek-V3/MoE 核心
长上下文技术 docs/LLM技术深度系列/07-长上下文技术完全指南.md RoPE、滑动窗口 Attention
顶级模型学习路径 docs/19-顶级模型学习路径与资料.md 资料合集、学习路线

三、必须掌握的技能栈

3.1 核心工程技能

TypeScript / Node.js
├── 严格类型系统(泛型、条件类型、infer)
├── 异步编程(async/await、Promise、AsyncGenerator)
├── 流式处理(ReadableStream、SSE、backpressure)
├── Zod 数据校验
└── 模块化架构(依赖注入、工厂模式)

React(用于 React Ink 终端 UI)
├── Hooks(useState/useEffect/useReducer/useSyncExternalStore)
├── 组件生命周期与副作用管理
└── 状态提升与 Context

Bun / 构建工具
├── bun:bundle 条件编译(feature flags / DCE)
└── 打包与单文件分发

3.2 Agent 框架设计能力

Agentic Loop 设计
├── 多轮 LLM 推理循环(stop_reason 判断)
├── Tool Use 协议(tool_use block → 执行 → tool_result)
├── 并行 vs 串行工具调度策略
├── 中断 / 恢复 / 取消机制(AbortSignal / AbortController)
└── 错误重试与降级策略

工具系统(Tool System)
├── Tool 接口定义(inputSchema / execute / permission)
├── 工具注册与发现机制
├── 权限检查前置拦截(Harness 边界)
└── 内置工具:Bash / Read / Write / Edit / Grep / WebFetch 等

多 Agent 协作
├── SubAgent 派发(AgentTool)
├── 任务编排(Task / coordinator)
├── 跨 Agent 状态共享
└── Swarm / Team 协调协议

3.3 安全与权限模型

权限决策树
├── Allow / Deny / Ask 三态模型
├── 路径级权限(checkReadPermission / checkWritePermission)
├── 命令级权限(BashTool 白名单/黑名单)
├── Internal Harness Path 豁免机制
└── 用户交互确认(permission prompt)

沙箱与隔离
├── 环境变量过滤(allowedEnvVars 白名单)
├── 文件系统边界(working directory 限制)
└── 远程容器隔离(CCR / Docker)

3.4 LLM 接入与流式处理

Anthropic SDK / OpenAI-compatible API
├── Streaming API(stream() → AsyncIterable<Event>)
├── Tool Use 消息格式(content blocks)
├── Token 计量与 Cost 追踪
├── System Prompt 构建与管理
└── 上下文窗口压缩(Snip / Compact 策略)

MCP(Model Context Protocol)
├── MCP Server 实现(工具/资源/提示)
├── MCP Client 连接管理
├── stdio / SSE transport
└── 动态工具扩展

3.5 系统设计能力

高并发连接管理
├── 事件驱动模型(C10K)
├── WebSocket 连接生命周期
└── 连接状态机设计

状态存储分层
├── L1 内存缓存(进程内)
├── L2 Redis(分布式缓存)
└── L3 数据库持久化

流式响应
├── SSE / WebSocket 推送
├── Streaming token 聚合
└── 客户端 backpressure 处理

可中断 Agent
├── AbortController 传播链
├── 检查点状态保存
└── 恢复机制设计

3.6 LLM 理论基础(对 DeepSeek 尤其重要)

Transformer 架构
├── Multi-Head Self-Attention(数学推导)
├── KV Cache 机制与内存优化
├── RoPE 位置编码
└── FlashAttention 原理

训练方法
├── 预训练(Next Token Prediction)
├── SFT(Supervised Fine-Tuning)
├── RLHF / PPO / GRPO
└── ⭐ Reasoning 模型(DeepSeek-R1 / Chain-of-Thought 强化)

架构创新(DeepSeek 特色)
├── ⭐ MoE(Mixture of Experts)稀疏激活
├── ⭐ MLA(Multi-head Latent Attention)
├── 长上下文扩展(滑动窗口、YaRN)
└── 推理效率优化(投机解码)

四、Harness 架构的核心概念速查

这是面试中最常考的「CC Harness」知识点:

┌──────────────────────────────────────────────────────┐
│ HARNESS(Claude Code) │
│ │
│ 用户输入 ──→ 权限预检 ──→ LLM 推理 ──→ 工具执行 │
│ ↑ ↓ │
│ Permission Tool Result │
│ Interceptor (过滤/脱敏后) │
│ ↓ │
│ 送回 LLM(下一轮) │
│ │
│ 关键职责: │
│ 1. 权限门控(Allow/Deny/Ask) │
│ 2. 工具调度(并行/串行/中断) │
│ 3. 输出过滤(hints 剥离、内容安全) │
│ 4. 状态管理(Session、上下文窗口) │
│ 5. 目录保证(ensureMemoryDirExists) │
│ 6. Hooks 执行(settings.json 配置的自动化行为) │
└──────────────────────────────────────────────────────┘

面试一句话总结:

“Harness 是 LLM 的执行环境(Runtime),负责权限验证、工具调度、状态管理和安全边界,LLM 只做推理决策,真正的副作用全由 Harness 代为执行和把关。”


五、关键源码文件速查

文件 作用 面试重要度
src/query.ts Agentic Loop 入口 ⭐⭐⭐⭐⭐
src/QueryEngine.ts 查询引擎抽象 ⭐⭐⭐⭐⭐
src/Tool.ts Tool 基类定义 ⭐⭐⭐⭐⭐
src/tools.ts 所有工具注册 ⭐⭐⭐⭐
src/Task.ts Task / SubAgent ⭐⭐⭐⭐
src/utils/permissions/filesystem.ts 文件权限决策 ⭐⭐⭐⭐
src/tools/BashTool/bashPermissions.ts 命令权限决策 ⭐⭐⭐⭐
src/memdir/memdir.ts 记忆目录管理 ⭐⭐⭐
src/utils/claudeCodeHints.ts Hints 侧信道 ⭐⭐⭐
src/entrypoints/cli.tsx CLI 入口 ⭐⭐⭐
src/screens/REPL.tsx 主交互循环 ⭐⭐⭐⭐
src/services/ 分析/压缩服务 ⭐⭐⭐
src/bridge/bridgeMain.ts 远程桥接核心 ⭐⭐

六、推荐学习顺序(3-4周计划)

第 1 周:Agent 框架核心

Day 1-2: docs/00 + docs/01 + docs/02(总览 + 启动 + Agentic Loop)
Day 3-4: docs/03 + docs/05(工具系统 + 权限安全)
Day 5-7: docs/17 + docs/16(流水线 + 智能核心)
配合阅读:src/query.ts, src/Tool.ts, src/tools/BashTool/

第 2 周:工程支撑与协议

Day 1-2: docs/08 + docs/10(流式 API + 上下文管理)
Day 3-4: docs/09 + docs/11(MCP + 多 Agent)
Day 5-7: docs/07 + docs/12(状态管理 + Bridge)
配合阅读:src/services/, src/bridge/, src/tasks/

第 3 周:LLM 理论(DeepSeek 特色)

Day 1-2: LLM系列/01(Transformer 深度)
Day 3-4: LLM系列/05(Reasoning 模型)—— DeepSeek-R1 核心
Day 5-6: LLM系列/06(MoE 架构)—— DeepSeek-V3 核心
Day 7: LLM系列/07(长上下文)

第 4 周:系统设计与面试准备

Day 1-2: OpenClaw系列/12(系统设计第一性原理)
Day 3-4: OpenClaw系列/13(面试速查表,背诵核心回答)
Day 5-7: 模拟面试 + 查漏补缺

七、面试高频问题预测(CC Harness 视角)

  1. 设计一个 AI Agent 框架,如何实现工具调用的权限控制?
    → 参考 docs/05-权限与安全系统.md,重点讲 Allow/Deny/Ask 三态 + 路径级权限

  2. 如何设计一个可中断、可恢复的 Agentic Loop?
    → 参考 docs/02 + docs/16,重点讲 AbortController 传播链 + 检查点

  3. 多个工具并发调用时如何保证安全性和一致性?
    → 参考 docs/03-工具系统.md,重点讲并行执行策略 + 工具间隔离

  4. 如何设计 LLM 的上下文窗口管理,防止 token 溢出?
    → 参考 docs/10-上下文窗口管理.md,重点讲 SNIP 压缩 + Token Budget

  5. MCP 协议的设计哲学是什么?如何扩展工具?
    → 参考 docs/09-MCP协议集成.md

  6. DeepSeek-R1 的 Reasoning 训练方式与普通 SFT 有什么区别?
    → 参考 docs/LLM技术深度系列/05-Reasoning模型训练技术全景.md

  7. MoE 稀疏架构相比 Dense 模型的核心优势?
    → 参考 docs/LLM技术深度系列/06-MoE稀疏架构深度解析.md



八、覆盖度评估(2026-05-27 最终版)

已完成文档(28篇)

模块 文档编号 精读深度
总览与路线 00
启动流程 01
Agentic Loop 02
工具系统 03
命令系统 04
权限安全 05
终端 UI 06
状态管理 07
API/Streaming 08
MCP 集成 09
上下文管理 10
多 Agent 系统 11
Bridge 系统 12
插件技能系统 13
成本追踪 14
工具函数库 15
智能核心机制 16
请求处理流水线 17
本地模型部署 18
学习路径资料 19
Swarm 协调系统 20 ✅ 精读14个源文件
SystemPrompt 构建 21 ✅ 精读 prompts.ts 915行
Session 管理恢复 22 ✅ 精读 sessionStorage.ts
MemDir 记忆系统 23 ✅ + findRelevantMemories 深度更新
Computer Use 24 ✅ 精读13个源文件(新增)
LSP 集成 25 ✅ 精读7个源文件(新增)
Plan Mode V2 26 ✅ 精读 planModeV2.ts(新增)
VCR 测试基础设施 27 ✅ 精读 vcr.ts 406行(新增)
面试题全集 28 ✅ 200+题,含代码题(新增)

覆盖度:✅ 100%(所有主要子系统均有深度文档)

整理时间:2026-05-27 | 基于 Claude Code 2.1.88 源码

打赏
  • 微信
  • 支付宝

评论